The following article is from 壹番 YIFAN Author 壹叔团队


文|郑亦久
进入 2026 年,AI 行业(háng yè)的焦点转向现实🌍世界。
本质上来看(lái kàn),再聪明的大模型其实也就是(jiù shì)一张嘴,而试图寻找一切机会摸鱼(mō yú) or 偷懒的用户真正需要的——还是能(néng)自己办事办成的工具。
可以说,当下(dāng xià)的字节和阿里几乎不约而同地向前(xiàng qián)迈了一步。
最近更新🔄的豆包从(cóng)入口层渗透,试图更多让用户(yòng hù)留在对话框里,从答题、音乐、电商、本地(běn dì)生活逐步集中到一个窗口中。

图源(tú yuán):豆包网页版
而在 1 月 15 日,阿里(ā lǐ)举集团之力,拿出大版本更新🔄的(de)千问则选择从执行端切入,把(bǎ)点外卖、订酒店、买机票这些复杂(fù zá)任务塞进同一个对话里,让 AI 负责完整(wán zhěng)流程。
双方都在回答同一个问题:AI 能(néng)不能从聊天者变成执行者。不同之处在于(zài yú),千问直接扎进任务现场,而豆包先(xiān)占据意图入口。
这场代理大战因此变成(biàn chéng)两条路径的比赛🏁:一条要通过闭环(bì huán)证明“我能办成事”,另一条则靠(kào)习惯养成,等生态慢慢补全。

图源:千问(qiān wèn) App
AI 代理本质是一种对产品生态要求🙏(yāo qiú)极高的形态。算力可以外包,模型(mó xíng)可以迭代,但支付、库存、履约、地图、出行(chū xíng)、线下服务这些现实🌍世界的系统📱,很难(hěn nán)在短时间⏰内为 AI 重新设计。
从这个前提(qián tí)出发,千问看上去确实占据了明面上(miàn shàng)的优势,因为它站在阿里长期(cháng qī)搭建的生态之上。但优势能维持(wéi chí)多久,并不只是技术问题,而是一场(yī cháng)长期的生态工程。

千问与豆包想(xiǎng)做什么、能做什么
把两家最近(zuì jìn)的动作💥摆在一起,可以看出它们大致相同(dà zhì xiāng tóng)的方向和清晰不同的路径。
千问(qiān wèn)这次声势浩大的大版本更新🔄,表明其(qí) Chatbot 服务不仅仅只是满足于给一个“答案(dá àn)”,而是直接接手“任务”执行。
两个基本场景(chǎng jǐng)就是办事和生活。前者基本就上(shàng)上班族日常会做的绝大多数工作内容(nèi róng),如 “整理发票”“做财务报表”“生成 PPT ”等 100 多个(duō gè)细分场景,都能通过千问直接代理(dài lǐ)解决。

当然对于更多普通人来说,工作(gōng zuò)之外的场景反而是当下 AI 工具使用(shǐ yòng)更多的情况。而这几乎也(yě)是各家大厂的必争之地,同时也是(shì)凸显不同产品生态差异度的场景(chǎng jǐng)。
像是用户说想点瑞幸、喜茶,千问要(yào)做的就是根据其在淘宝闪购(shǎn gòu)这些阿里体系内服务留存下来的(de)习惯,自动下单并完成支付,最后把(bǎ)咖啡、奶茶送到用户手上。
用户说明天(míng tiān)一早要去上海,千问则会从(cóng)飞猪上筛选航班、比较舱位和价格(jià gé),给出候选列表,再把确认步骤压缩(yā suō)回一条会话。

对用户来说,只是多(duō)说了几句;对系统📱来说,是把原本(yuán běn)分散在多个应用里的流程集中(jí zhōng)到同一个入口里。
在这个过程中(zhōng),阿里把多年积累的电商、本地生活(shēng huó)和出行能力重新打包到千问上,希望(xī wàng)让它成为用户处理生活事务的(de)操作层,而不是单纯的聊天入口(rù kǒu)。千问的方向很直白,就是要证明(zhèng míng):AI 可以真正办成事。
当然,如果看之前(zhī qián)豆包 AI 手机助手的想法,字节其实已经(yǐ jīng)试图通过豆包在移动端实现这些(zhè xiē)事。
甚至说其更加激进的试图(shì tú)跳出对话框,直接在手机终端实现上述(shàng shù)所有能力。当然结果我们也都知道(zhī dào)了,那就是惨遭各家大厂围堵,无疾而终(wú jí ér zhōng)。

豆包手机助手
不过这并不意味着(yì wèi zhe)豆包就放弃了代理路线,只不过在(zài)目前其它大概还没有能力去追求🙏(zhuī qiú)完整闭环,因此更多只能耐心承接(chéng jiē)更轻量的任务。
像是接入更多(duō)已有的生态服务,如今豆包用户说(shuō)“来点音乐”,豆包直接在对话窗口(chuāng kǒu)里播放汽水音乐;用户问嘴唇干(gàn)怎么办,它先解释原因,再把抖音(dǒu yīn)商城里的润唇膏卡片贴在答案(dá àn)下面;用户问周末去哪玩,它(tā)一边给建议,一边顺手挂上本地(běn dì)团购链接。

图源:豆包 App
这些动作💥单独看(kàn)都不算“完成任务”,但每一步都(dōu)拦住了用户的注意力,把问题和(hé)后续行为继续保留在其对话框内(nèi)。
相对于豆包手机助手的激进,目前(mù qián)豆包这种推进方式基本上还是以我为主,先(xiān)将字节系内部能力缝合进 AI 代理(dài lǐ)的服务流程。
看起来确实不像是一套(yī tào)完整的代理系统📱,更像一种在(zài)缝隙里试探的自动化能力。对于日活(rì huó)过亿的豆包而言,只要问题先落(xiān luò)在自己手里,后面的执行就可以(kě yǐ)有时间⏰慢慢完善。
一条路从执行(zhí xíng)往入口回流,一条路从入口向(xiàng)执行外扩。说到底其实还是两家在 AI 之外(zhī wài)产品生态的差距问题,而这恰恰(qià qià)也是当下 AI 代理的命门所在。

AI 代理(dài lǐ)的真门槛:生态是基础,但不是(bú shì)终点
真正把这两条路径拉开距离的(de),与其说是基础模型能力,不如说是生态能力。
模型(mó xíng)当然不会自动变成跑腿的,能够调用(diào yòng)支付、出行、地图、身份和客服体系的(de)能力才会。1 月 15 日这一天就(jiù)能实现点一杯奶茶的千问(先(xiān)别管是不是点贵了),正是因为它站(zhàn)在阿里常年累积下的产品生态(shēng tài)上,有着完整的产品闭环,可以说(shuō)只要接好入口,就能不断扩展(kuò zhǎn)场景。

图源:千问与淘宝闪购对比
毕竟(bì jìng)不论是美团还是闪购,或者支付宝、微信支付(zhī fù)都不可能给予豆包这些权限,尤其(yóu qí)是在国内的生活核心场景几乎(jī hū)完全围绕移动端展开的情况下(xià)。
豆包即便想做,更多也只能(zhǐ néng)在桌面端实现类似 Manus 这样的能力(néng lì),但移动优先的国内市场,这一层(yī céng)级的代理能力显然是不够的(de)。
当然,并不是说有了生态,AI 代理(dài lǐ)的无敌于天下了。越往深处看,这种优势(yōu shì)也越显得沉重。
每一个新增场景(chǎng jǐng)背后,都是一次系统📱改造。接口需要(xū yào)重写,风控逻辑需要迁移,业务责任需要(xū yào)重新划分。这一时刻千问代理说暴露(bào lù)的问题,最简单就是有部分网友(wǎng yǒu)晒出通过其点外卖比闪购还贵,极大(jí dà)可能还是归咎于内部的权限分配问题(wèn tí)。

图源:千问 App 发布会
如果所有阿里系的(de)服务都被抽象成可以被 AI 调用(diào yòng)的能力,本质上是千问之外阿里(ā lǐ)内部其他部门必须出让一部分核心控制权(kòng zhì quán),把行为数据和执行权交给千问。
AI 当然(dāng rán)可以不分亲疏,但有人的地方(dì fāng)就有山头,淘宝闪购去年一年烧掉(shāo diào)几百亿换来的市场份额,如今全部给千问(qiān wèn)这个毛头小子做嫁衣,任谁心里也(yě)不会好过吧。
更现实🌍的一点在于(zài yú),阿里生态并不等于整个互联网。
千问的代理(dài lǐ)能力再强,就目前而言也只能覆盖(fù gài)阿里体系内能掌控的轨道。但现实🌍(xiàn shí)世界里用户的生活并不是按(àn)生态来划界,第三方是否愿意开放接口(jiē kǒu),平台是否愿意让 AI 代替用户操作,监管(jiān guǎn)在其中如何划线,这些都不是千问(qiān wèn)自己可以决定的变量。

图源:网络
就(jiù)好比大肆强调的点外卖,无法有(yǒu)别家比价的话,对于普通用户来说,究竟是(shì)感受所谓智能重要,还是能省钱更(gèng)重要。
尤其是国内的生态也不仅仅(bù jǐn jǐn)只有阿里。即便豆包和字节在很多(hěn duō)方面还有明显,换了 AI 一号位的(de)腾讯的微信生态显然不会弱于阿里(ā lǐ),可以说阿里所谓的生态优势仅仅(jǐn jǐn)也只是相对而言。
从这个意义上看(kàn),没有什么胜负是已经确定了的(de),尤其是在 AI 本身能力依然还在(zài)快速迭代的情况下。

千问得益于生态(shēng tài),也受制于生态;豆包缺少生态,却握着(zhe)入口。一方需要解决的是如何长期(cháng qī)动员体系、压低改造成本,让体系内(nèi)的服务更好的存在于在千问(qiān wèn)名下;另一方需要解决的是如何把(bǎ)入口优势转化为可持续的执行力(zhí xíng lì),寻找更多巨头生态之外的援兵(yuán bīng)。
AI 代理大战接下来会进入拉锯阶段,拼(pīn)的大概不会是谁最先凭借生态(shēng tài)能力做出华丽的功能清单,而是谁(shuí)打破生态的边界真正让用户通过(tōng guò) AIh 获得最佳的体验。










